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摘 要 : 针对 变化 环境 下 径流 时 间 序 列 复 杂 的 非 线性 、 非 平稳 性 特征 ,为 提高 中 长 期 径流 预测 的 准 


确 性 ,运用 多 种 时 频 分 析 方 法 构建 组 合 预 报 模型 


以 探究 适用 性 。 以 干旱 区 典型 内 陆 河 玛 纳 斯 河 为 


例 ,利用 经 验 模 态 分 解 (EMD)、 交 分 模 态 分 解 (VMD)、 离 散 小 波 变换 (DWT) 时 频 分 析 方 法 对 径流 时 


间 序 列 进行 多 尺度 分 解 ,得 到 不 同 频 率 和 特征 


子 序列 。 以 前 期 径流 、 降 水 量 、 气 温 、 大 气 环流 因 
子 等 作为 长 短期 记忆 神经 网 络 模型 (LSTM) 的 输入 变量 ,采用 随机 森林 法 和 Pearson 相关 系数 法 确 


定 各 子 序列 的 最 佳 预报 因子 ,基于 时 频 分 析 方 法 分 别 构建 EMD-LSTM、VMD-LSTM、DWT-LSTM 组 


合 预 报 模 型 ,通过 LSTM 模型 对 各 子 序列 进行 预测 ,加 和 重 构 获得 最 终 预 测 结 果 , 并 与 单一 的 误差 
反 向 传播 神经 网 络 (BP)、 极 限 学 习 机 (ELM)、LSTM 模 型 的 预测 结果 进行 对 比分 析 。 结 果 表 明 : 组 
合 模型 VMD-LSTM 预报 误差 最 小 、 精 度 最 高 ,纳什 系数 保持 在 0.9 以 上 ,有 效 避 免 了 过 拟 合 等 问题 ， 
其 径流 极 值 预测 误差 在 15% 以 内 ,对 径流 总 体 趋 势 预测 和 极 值 的 追踪 均 有 和 良好 效果 。 研 究 结果 可 


为 流域 水 资源 规划 与 调度 提供 参考 。 
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受气 候 变化 .人 类 活动 等 多 因素 影响 ,河川 
径流 表现 出 较 强 的 随机 性 ` 灰色 性 . 非 线性 等 特 
征 …”: 。 玛 纳 斯 河 位 于 西北 干旱 区 ,径流 补给 主要 
依靠 冰川 融 水 ,其 径流 时 间 序 列 具 有 更 强 的 随机 性 
和 非 平稳 性 , 且 融 雪 性 径流 的 异常 对 流域 产生 不 利 
影响 ,因此 ,提高 径流 预报 模型 的 精度 是 西北 干旱 


据 驱 动 是 河川 径流 主要 预测 方法 “。 过 程 驱动 是 以 
模拟 或 反映 降雨 径流 过 程 中 流域 产 汇流 机 理 的 概 
念 性 或 集 总 式 水 文 模型 为 主 , 需 要 考虑 不 同时 空 

度 下 的 水 文 规 律 和 参数 的 不 确定 性 ,在 数据 缺 测 地 
区 的 预测 能 力 受 到 限制 ”, 而 数据 驱动 模型 无 须 考 
虑 水 文 过 程 的 物理 机 制 , 随 着 时 间 序 列 处 理 技术 的 
发 展 , 水 文 水 资源 学 科 和 人 工 智 能 逐渐 存在 交 
X ,较为 广泛 地 运用 于 径流 研究 中 并 取得 良好 的 
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效果 “7”, 如 传统 时 序 建 模 方法 (ARIMA)、 人 工 神经 
网 络 模型 (ANN) 支持 向 量 机 (SVM ) SE. 

基于 深度 学 习 的 快速 发 展 ,长 短期 记忆 神经 网 
络 模型 被 逐渐 运用 于 水 文 预 测 之 中 ,其 可 挖掘 输出 
与 相关 输入 变量 之 间 空 间 和 时 序 性 的 关联 ,在 递归 
结构 中 加 入 门 控 运 算 ,同时 在 复杂 时 间 序 列 预 测 领 
域 也 有 较 多 应 用 ” 。 深 度 学 习 在 挖掘 数据 特征 方 
面 , 相 较 于 目前 的 径流 预测 方法 ,在 一 定 程 度 上 可 
弥补 其 不 足 ,提高 模型 拟 合 效果 。Kratzert 等 “利用 
大 量 数据 探索 长 短期 记忆 神经 网 络 模型 (LSTM ) 对 
流量 预测 情况 ,通过 预测 结果 与 实际 流量 进行 对 
EE ,得 出 LSTM 在 处 理 长 时 间 序 列 有 较 好 的 效果 ; 顾 
1f& "44 f Simple- LSTM 模型 ,与 前 向 型 神经 网 络 
(FNN) 和 SVM 相 比 可 获得 更 高 的 预报 精度 ; 冯 锐 ” 
提出 LSTM-BP 耦 合 径流 预测 改进 模型 , 较 误 差 反 向 
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传播 神经 网 络 (BP) 和 LSTM 的 预报 速度 更 快 .精度 
更 高 。 

径流 时 间 序 列 是 含有 多 种 频率 和 趋势 成 分 的 
非 线 性 非 平 稳 序 列 ,其 非 平稳 性 和 非 线 性 增加 了 直 
接 预 测 的 难度 于 所 。 因 此 基于 时 频 分 析 的 数据 预 处 
理 方 法 已 逐渐 运用 于 水 文 分 析 之 中 “5 。 通 过 将 原 
始 径流 序列 分 解 为 不 同 频率 的 子 序列 ,使 径流 序列 
趋 于 平稳 化 ,将 各 子 序列 分 别 带 入 模型 预测 以 提高 
预测 的 精度 。Giulia 等 "建立 EMD-ANN 分 解 -集成 
模型 ,预测 结果 有 明显 的 提高 ,验证 了 模型 的 有 效 
TE ; Tayyab 等 中 应 用 小 波 变换 将 各 子 序列 与 BP、 径 
向 基 函 数 神经 网 络 (RBF ) 模 型 组 合 ,构建 DWT-BP 
和 DWT-RBF 组 合 模型 ,与 单一 模型 相 比 预测 结 
得 到 了 明显 的 提升 ; 刘 艳 等 ”将 玛 纳 斯 河 的 局 部 信 
息 运 用 集合 经 验 模 态 分 解 (EEMD ) 预 处 理 ,构建 传 
统 时 序 建 模 方法 (ARIMA ) 组 合 模型 ,可 有 效 提高 预 
测 准确 性 ; 赵 力 学 等 "运用 VMD-BP 模 型 来 处 理 水 
位 流量 的 非 线性 拟 合 ,取得 较 好 的 结果 。 目 前 研究 
发 现 分 解 技术 能 够 有 效 提高 径流 预测 精度 ,但 大 多 
数 研 究 未 考虑 预报 因子 对 子 序列 的 影响 。 

本 文 结合 不 同时 频 分 析 方法 和 LSTM 模型 的 优 
点 ,构建 基于 经 验 模 态 分 解 (EMD) 、 变 分 模 态 分 解 
(VMD) .离散 小 波 变换 (DWT) 的 LSTM 组 合 预报 模 
型 ,运用 随机 森林 法 和 了 Pearson 相关 系数 法 优选 历史 
径流 、 降 水量、 大 气 环流 因子 等 水 文 气象 要 素 作 为 
输入 项 ,比较 不 同时 频 分 析 方 法 对 提高 玛 纳 斯 河 径 
流 预 报 精度 的 贡献 程度 ,对 比分 析 组 合 模型 和 单一 
模型 在 本 研究 区 的 适用 性 ,并 探究 分 解 技术 下 大 气 
环流 因子 对 径流 子 序列 的 影响 ,结果 可 为 流域 水 资 
源 开发 利用 与 调配 提供 技术 支持 。 


1 研究 区 概况 


玛 纳 斯 河 发 源 于 天 山北 芒 的 依 连 哈 比尔 基山 ， 
为 准噶尔 盆地 南 缘 最 大 的 一 条 融雪 型 河流 ,流域 地 
处 欧 亚 大 陆 腹 地 2 ,流域 范围 为 43"21'~45"20'N， 
84?43' -86?35' E, MARANA 2.43x10* km。 玛 纳 斯 河 
流域 深 居 内 陆 远离 海洋 ,年 平均 气温 6.0~6.9 % ,年 降 
水 量 110~300 mm, HT 2 a} fti 4835 , 4E 28 A tit 1500~ 
2000 mm, Jas T Hii st A TE T S^ T RAI, 
肯 斯 瓦特 水 文 站 海拔 910 m, 控 制 面 积 4637 km? 是 玛 
纳 斯 河 干支 流 汇 合 后 的 出 山口 控制 站 (图 1)。 


人 


图 例 


e 肯 斯 瓦特 水 文 站 NER 
一 一 流域 边界 
A = 825 0 aem 


图 1 肯 斯 瓦特 站 控制 区 域 


Fig. 1 Control area of Kenswart station 


2 数据 与 方法 


2.1 数据 资料 

本 文采 用 的 数据 为 肯 斯 瓦特 水 文 站 1956 一 
2014 年 径流 .降水 量 .气温 .74 项 大 气 环 流 因子 的 月 
尺度 数据 。 由 于 各 数据 量 级 相差 过 大 ,将 其 归 一 化 
处 理 。 其 中 1956 年 1 月 至 2010 年 12 月 数据 用 于 模 
型 训练 ,2010 年 1 月 至 2014 年 12 月 数据 用 于 模型 验 
证 。 水 文 数据 来 源 于 石河 子 水 文 局 ,大 气 环流 因子 
数据 来 源 于 http://www.esrl.noaa.gov/。 
2.2 研究 方法 
2.2.1 经 验 模 态 分 解 (EMD) EMD” eH ER 
件 将 信号 分 解 为 多 个 具有 物理 意义 的 固有 模 态 函 
数 (IMF)。 计 算 步 又 如 下 : 

C1) 确定 原 序列 x(t) 所 有 局 部 极 值 点 ,利用 三 
次 样 条 插值 函数 进行 拟 合 其 上 包 络 线 x (0) 和 下 包 
络 线 x (1) 。 

(2) 上 下 包 络 线 的 平均 包 络 线 记 作 me) :计算 
原 序列 x(t) 与 m(t) 的 差 值 序列 h(t) : h(t)=x(i)- 
m(t) o 

(3) Æ h(t) 满足 以 下 2 个 条 件 : 在 任意 时 刻 , 由 
极端 值 定义 的 上 包 络 线 和 下 包 络 线 均值 为 0; 各 个 
瞬间 平均 值 为 0。 若 不 满足 条 件 , 则 让 h(i) 重复 以 
上 步骤 ,直到 满足 条 件 为 止 ; 若 h(t) 满足 上 述 条 件 ， 
WU h(t) 成 为 第 一 个 固有 模 态 函数 10D) 。 

(4) 将 原 序 列 减 去 T(t) ,计算 得 到 剩余 项 mn(D) : 
r(t) = xlt) - 1t) ,把 mm(O 视 为 新 的 原 序列 ,重复 上 述 
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步骤 ,分 解 出 全 部 的 固有 模 态 函数 ,直至 单调 的 残 
余 项 出 现 才 结 
222 变 分 模 态 分 解 (VMD) VMD 是 在 EMD 的 基 
础 上 提出 的 一 种 自 适 应 的 信号 处 理 方法 “。 通 过 
搜索 和 求解 过 程 确 定 最 优 的 中 心 频率 和 有 限 带 宽 ， 
完成 信号 的 频 域 剂 分 及 各 分 量 的 分 离 。 

原始 信号 分 解 为 上 个 分 量 ,保证 各 模 态 估计 带 
宽 之 和 最 小 。 约 束 条 件 是 分 解 出 的 全 部 模 态 之 和 
与 原始 信号 相同 , 变 分 约束 表达 式 为 : 


"lx s [oo + Ls" D =f(t) (1) 


式 中 : uu) V dou) SPL EA fU S k GS AT TEC 
中 心 频率 ;为 模式 数 ; 0, 为 梯度 运算 ; 6(1) 为 狄 克 
拉 函 数 ;j 为 虚数 单位 ;i 为 时 间 ;* 为 卷 积 符号 ; u(t) 
为 第 个 分 解 模 态 下 的 第 1 个 数据 ;e” 为 预 估 中 心 
频率 ; c, m (0, @,, ++, 0.) 为 各 中 心 频率 集 ;s.t. 为 约 
束 条 件 ;K 为 需要 分 解 的 模 态 个 数 ; u, = (us, us, n uy} 
为 各 模 态 函数 集 ; f(t) 为 原始 信号 。 
求解 式 (1) 并 引入 Lagrange FEA SF HARE 
分 问题 转换 为 非 约 束 问题 ,得 到 扩展 Lagrange R 
达 式 : 
L=({u}, {o,}, a)= aY| a(S) «jme (De™ 


2 
+ 
2 


|/0- Xt 


«atr 0- Lu) 
(2) 
式 中 :和 A 和 a 分 别 为 拉 格 朗 日 乘 数 和 二 次 惩罚 参数 。 
运用 交替 方向 乘 子 (ADMM)"3 算 法 迭代 搜索 ， 
迭代 后 的 u,、w, 和 入 的 表达 式 如 下 : 
iy = f(@)- > ulo) 十 Maye 
1+ 2a(@-w,) 

INT i; (o) |do 
oteo l (4) 
i "HO do 
À lo) i (v) exo - YQ) (5) 


P: ELPA S a, (w) ulo). 7 (o) 、A(w) 
分 别 对 应 ut (t) 、 w(t) n f(t) | A(t) B E np EHR ; 
w 为 频率 ; y 为 噪声 容忍 度 。 

VMD 主要 迭代 求解 过 程 如 下 : 

(1) 初始 化 ww ~ w, 丸和 最 大 迭代 次 数 N,ne0; 


(3) 


(2) 根据 公式 (3) 和 (4) 更 新 wu 和 wow,; 

(3) 根据 公式 (5 ) 更 新 入 ; 

(4) 精度 收敛 判断 依据 a>0 ,如 果 不 满足 
Yl -alel <e 且 n<N, 则 回 到 第 二 步 ,否则 
完成 迭代 ,输出 最 终 的 wu Flo, o 
2.2.3 离散 小 波 变换 (DWT) DWT 逐 层 将 信和 号 分 
解 到 不 同 频率 通道 上 ,获取 更 加 单一 .平滑 的 各 子 
序列 %%。 基 于 Mallat 算 法 实现 信号 的 分 解 与 重 构 ， 
其 表达 式 为 : 


m 


ams jie (6) 
c=He, * 6d, j=J-1,J-2,°,0 (7) 
式 中 : c 为 分 解 尺度 j+1 下 的 低频 信号 ;五 为 低 通 
VEDAS c; 为 分 解 尺 度数 为 /时 的 低频 信和 号; di. 为 
DERNE 下 的 高 频 信 号 ;6C 为 高 通 滤波 器 ;7 为 分 
解 尺 度数 ; 五 为 重 构 低 通 滤波 器 ; C 为 重 构 高 通 滤 
通过 公式 (6) 将 原始 信号 cy 分解, 得 到 1 组 合并 
后 的 低频 子 信号 c, 和 .J 组 高 频 子 信号 dii d; sid, 
采用 公式 (7) 对 c; M d, d, s ss di 序列 重 构 , 有 效 地 
实现 信号 的 特征 分 离 。 
2.2.4 长 短期 记忆 神经 网 络 (LSTM) LSTM 可 以 
避免 长 依赖 问题 ,适用 于 处 理 有 较 长 时 间 间 隔 和 
延迟 的 事件 ,结构 如 图 2 所 示 。 将 不 同 的 序列 作为 
LSTM 的 输入 项 ,通过 门 探 单元 读 取 与 调整 隐 含 状 
态 向 量 和 记忆 状态 向 量 , 以 此 实现 各 序列 的 预测 。 
其 相关 计算 方法 如 下 : 


DH 


— 


X 
oO 


ha 


LE: o 为 Sigmoid 函数 ;tanh 为 双 曲 余弦 函数 ; e, h 分别 为 第 
1-1 时刻 记 忆 单 元 状态 变量 和 隐藏 层 状态 ; c, n h, 分别 为 第 1! 时刻 记 
忆 单 元 状态 变量 和 隐藏 层 状态 ;了 为 输入 信息 ;7 为 输出 信息 。 
图 2 长 短期 记忆 神经 网 络 神经 元 结构 示意 图 


Fig. 2 Diagram of neuron structure of long-short term memory 
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fS o(W,x, * U,h, ,* b;) (8) 
i, o (W,x, * Ujh, ,* b) (9) 
é,=tanh(W,x, + U,h, +b.) (10) 
c, «f, GO e, +i, © €, (11) 

o, 2G (W,x, * U,h, ,* b;) (12) 
h, - tanh(c,) C9 o, (13) 


式 中 : 为: 时刻 的 遗忘 门 ;o 为 Sigmoid 函数 ;WU 
为 权重 矩阵 ; x, 为 时刻 的 输入 ; hh 为 -1 时 刻 的 
隐 含 层 状 态 ;5 为 仿 置 向 量 ; i 为 :时刻 输 入 门 ; 6 为 
记忆 更 新 向 量 ;tanh 为 双 曲 余弦 函数 ; 6c, 为 1 时刻 的 
记忆 单元 状态 变量 ;@ 为 向 量 标量 积 ; c, ,为 -1 时 
刻 记 忆 单 元 状态 变量 ; o, 为 1 时 刻 的 输出 门 ; h, 为 
时 刻 隐 含 层 状态 。 
2.3 模型 性 能 评价 

模型 精度 评价 指标 采用 均 方 根 误差 (Root mean 
square error, RMSE) .纳什 系数 (Nash sutcliffe error, 
NSE) 和 决定 系数 (Coefficient of determination, R°) 。 
有 具体 公式 如 下 : 


RMSE = | ACA - Q,(i)} (14) 
Mo - 0,0] 
Fo -可 


fo-ao- 可 
R= - (16) 
>[oO- 可 >[oO- 可 
式 中 :NN 为 预测 月 数 ; Or(D) 为 预测 径流 量 ; QU) 为 
实测 径流 量 ; 0, 为 实测 径流 量 均值 ; Q, 为 预测 径流 
量 均值 。 


3 结果 与 分 析 


3.1 基于 EMD 的 时 间 序 列 分 解 

利用 EMD 对 肯 斯 瓦特 水 文 站 1956 年 1 月 至 
2014 年 12 月 径流 时 间 序 列 进行 分 解 , 结 果 如 图 3 所 
示 ,EMD 将 原始 序列 自 适 应 地 分 解 为 高 频 到 低频 的 
6 个 固有 模 态 分 量 函 数 (IMF) 和 1 个 趋势 项 分 量 
(R) ,IMF1 不 规则 是 由 径流 序列 的 非 线性 和 噪声 成 
分 所 导致 ,进一步 验证 径流 序列 的 非 线 性 和 非 平稳 
性 。 分 解 后 IMFI1 频率 最 高 ,振幅 最 大 ,包含 了 原始 
序列 的 主要 信息 ,分量 IMF2~IMF6 频率 依次 降低 ， 
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注 :IMF1~IMF6 为 国有 模 态 分 量 ;R 为 趋势 项 。 下 同 。 
图 3 基于 经 验 模 态 分 解 (EMD ) 的 径流 分 解 结 


Fig. 3 Runoff decomposition results based on empirical 


mode decomposition (EMD) 


振幅 依次 减 小 ,显示 出 原始 序列 的 局 部 特征 ,趋势 
项 表明 肯 斯 瓦特 水 文 站 的 径流 量 呈 现 上 升 趋势 。 
3.2 基于 VMD 的 时 间 序 列 分 解 
利用 VMD 对 时 间 序 列 分 解 结果 如 图 4 所 示 , 原 
台 径流 序列 分 解 为 从 低频 到 高 频 的 多 尺度 子 序列 ， 
充分 分 离 了 模 态 分 量 ,避免 混 频 现象 以 获得 平稳 的 
径流 序列 分 量 ,使 用 传统 的 EMD 方法 确定 子 序 列 的 
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图 4 基于 变 分 模 态 分 解 (VMD ) 的 径流 分 解 结 


Fig.4 Runoff decomposition results based on variational 


mode decomposition (VMD) 


数量 ,剩余 参数 y .a 分 别 设置 为 0、2000。 
3.3 基于 DWT 的 时 间 序 列 分 解 

由 于 径流 是 离散 的 , 故 采用 DWT 分 解 径 流 , 通 
过 比较 选用 小 波 函 数 db3 进行 分 解 ,DWT 层 数 为 3 
层 , 从 图 $ 可 以 看 出 , 子 序列 由 1 个 逼近 信和 号 (A3) 和 
3 个 细节 信号 (D1.D2.D3) 组 成 。 通 近 信号 保留 了 
原始 序列 中 规律 性 较 好 的 趋势 项 .周期 等 特征 ,而 
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0E A3 Arift fii SPH ; DI-D3 为 细节 信和 号 序列 。 
图 5 基于 离散 小 波 变换 (DWT) 的 径流 分 解 结果 
Fig. 5 Runoff decomposition results based on discrete 
wavelet transform (DWT) 


细节 信和 号 包含 了 更 多 随机 信息 和 噪声 。 

结合 图 3、 图 4、 图 5 可 观察 出 ,VMD 表现 出 更 好 
的 噪声 鲁 棒 性 ,一 定 程 度 上 有 效 降低 了 EMD 方 法 分 
fit PREA TEL BAUER E ,在 时 间 序 列 分 解 上 更 有 优 
势 , 同 时 改善 了 数据 的 分 析 效 果 。DWT 具 有 良好 的 
时 频 局 域 化 特性 ,但 高 频 分 量 的 频率 越 高 其 数据 规 
律 性 越 差 , 拟 合 及 预测 精度 随 之 越 低 。 因 此 ,分 解 
方法 均 可 提取 原始 序列 中 具有 不 同 频率 的 固有 信 
息 , 降 低 原 有 信号 的 波动 性 。 
3.4 预报 因子 优选 结果 

以 前 期 径流 .降水 量 .气温 大气 环 流 因子 等 作 
为 输入 变量 ,利用 Pearson 相关 系数 法 计算 气温 、 降 
水 量 径流 与 各 序列 在 不 同 滞 时 下 的 相关 性 (图 
6)。 基 于 相关 系数 优选 预报 因子 ,相关 性 高 于 0.1 
满足 95% 置 信 度 检验 ,将 相关 性 高 于 0.1 的 序列 当 
作 预 选 输入 项 。 由 图 6 可 知 ,各 序列 通过 相关 性 检 
验 较 多 ,但 径流 预报 模型 输入 项 需要 强 相 关 性 因 
子 ,部 分 因子 相关 性 较 高 但 作用 重复 ,可 能 降低 预 
测 精 度 , 故 须 进 一 步 筛选 半 ,在 相关 性 结果 基础 上 
再 运用 随机 森林 法 获取 最 佳 输入 项 。 如 单一 模型 
的 最 佳 输入 项 有 滞 时 为 0.1 个 月 的 降水 , 滞 时 为 1 
个 月 的 径流 以 及 清 时 为 0.1 个 月 的 气温 。 同 理 优选 
各 子 序 列 的 最 佳 输入 项 ,构建 组 合 模型 。 

运用 随机 森林 法 对 各 序列 在 不 同治 时 下 进行 
大 气 环流 因子 重要 性 排序 ,选取 重要 性 前 5 项 的 因 
子 , 时 频 分 析 方 法 的 子 序 列 对 应 的 大 气 环流 因子 选 
取 结 果 见 表 1。 其 中 A~S 分 别 表示 :A 为 大 西洋 副 高 
JEF (55°~25°W ) , B 为 北半球 极 涡 强 度 指数 (5 区 ， 


0-360?) , C 为 西藏 高 原 (25°~35°N,80°~100°E),D 
为 太平 洋 区 涡 强 度 指数 (2 区 ,150°E~120°*W),E 为 
亚洲 区 极 涡 强度 指数 (1 区 ,60°~150°E),F 为 东亚 柳 
强度 (CQ) ,G 为 东亚 槽 位 置 (C 双 ) ,再 为 大 西洋 欧洲 
环流 型 C,I 为 北美 区 极 涡 强 度 指数 (3 EX, 120°~30° 
W) ,J 为 北半球 极 涡 面 积 指数 (5 区 ,0~360°) ,K 为 北 
半球 极 涡 中 心 强度 (JQ) ,LL 为 北半球 极 涡 面 积 指数 
(5 区 ,0~360°) , M 为 北半球 极 涡 中 心 位置 (JW)，,N 
为 南方 涛 动 指 数 ,0 为 西 太 平 洋 副 高 西 伸 疹 点 ,P 为 
太阳 黑子 ,Q 为 北美 大 西洋 副 高 北 界 (110°~20°W ) ， 
R 为 亚洲 区 极 涡 面 积 指数 (1 区 ,60°~150°E) ,S 为 欧 
亚 经 向 环流 指数 (IM,0~150°E)。 综 上 结果 选取 影 
响 中 亚 地 区 的 大 气 环流 结果 部 分 与 杨 莲 梅 等 ”的 
人 研究 有 较 好 的 一 致 性 。 
3.5 预测 结果 

基于 不 同时 频 方法 分 别 与 LSTM 建立 组 合 预 测 
模型 ,考虑 预报 因子 与 各 子 序列 的 滞后 性 ,将 优选 
后 的 预报 因子 作为 模型 的 输入 项 ,分 别 对 各 子 序列 
预测 模拟 ,最 终 预测 结果 为 各 子 序列 的 预测 值 累 
加 。 为 了 定量 分 析 预 测 的 结果 ,采用 均 方 根 误差 
(RMSE) .纳什 系数 (NSE) 和 决定 系数 ( 尼 ) 等 指标 来 
判别 预测 精度 ,并 与 单一 BP、ELM、LSTM 以 及 未 融 
合 大 气 环 流 因子 的 组 合 模 型 的 预测 结果 进行 对 比 
分 析 。 
3.5.1 基于 单一 模型 径流 预测 ”不同 模型 的 评价 指 
标 见 表 2, 对 比 单一 模型 的 预报 结果 可 知 ,BP、ELM、 
LSTM 模 型 NSE # R^35 KT 0.80, (A RMSE EAT 
0.40。 在 验证 期 中 LSTM 模型 NSE X 0.879, FH BE 
BP ELM 模拟 结果 分 别提 高 了 8.79% 4.27% ; 尼 为 
0.884, 分 别提 高 了 2.20% ,1.3896 ;相应 的 RMSE 为 
0.505 ,分 别 降低 了 20.72% ,12.3396 ,表明 LSTM 模型 
在 径流 预测 中 效果 更 佳 。 通 过 模型 原理 可 知 ,BP、 
ELM 模型 存在 易 陷 和 人 局 部 最 优 且 没有 时 序 概念 等 
问题 ,而 LSTM 模型 通过 门 结构 设计 在 处 理 长 时 间 
序列 更 具有 优势 , 极 大 保留 水 文 气象 要 素 的 完整 
BE ,其 模拟 预测 结果 更 为 理想 。 表 2 所 示 ELM 模型 
预测 结果 略 优 于 BP 模 型 , 因 BP 模 型 容易 出 现 过 拟 
合 。 图 7 为 单一 模型 月 径流 预测 结果 ,根据 变化 趋 
势 看 出 ,单一 模型 追踪 月 径流 的 动态 变化 有 较 好 的 
结果 ,但 是 在 时 间 序 列 变化 极 值 点 的 预测 效果 均 不 
理想 ,单一 模型 的 预测 能 力 受 到 径流 序列 波动 性 的 
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UE: VMD 为 变 分 模 态 分 解 ;DWT 为 离散 小 波 变 换 ;EMD 为 经 验 模 态 分 解 。 下 同 。 


图 6 基于 Pearson 相 关系 数 的 输入 因子 优选 


Fig. 6 Optimization of input factor based on Pearson correlation coefficient 


影响 ,尤其 BP 模 型 更 容易 出 现 极 值 偏差 , 极 值 预测 
精度 有 限 。 

3.5.2 基于 组 合 模 型 径流 预测 “由 表 2 预 测 结果 可 
看 出 采用 不 同 分 解数 据 预 处 理 的 LSTM 组 合 模型 , 
当 子 序列 通过 预测 合成 后 的 结果 对 比 单一 模型 表 
现 出 较 大 预测 性 能 的 提升 。 组 合 模型 中 NSE F R 
HKF 0.85, H. RMSE 均 小 于 0.30。EMD-LSTM 模 
型 预测 精度 与 DWT-LSTM 模型 相差 很 小 , VMD- 
LSTM 模型 分 解 预测 精度 普遍 高 于 EMD-LSTM、 


DWT-LSTM 的 分 解 预测 精度 ,其 预测 效果 最 佳 . 误 
差 最 小 ;VMD-LSTM 模型 相 较 EMD-LSTM 模型 ,其 
在 验证 期 的 NSE 尼 提 高 幅度 为 3.229% . 3.75% , 
RMSE 降低 15.7596; 运用 VMD-LSTM 模型 进行 分 解 
预报 相 较 DWT-LSTM 模型 其 验证 期 的 NSE . 尼 提 高 
幅度 为 3.56% 、4.33% , RMSE 降低 16.85% 。 说 明 
VMD 方 法 能 有 效 识 别 并 滤 除 原始 径流 序列 的 噪声 ， 
具有 良好 的 非 线性 处 理 能 力 ,改进 了 EMD 方 法 存在 
的 模 态 混和 县 问题 ,从 而 提高 径流 序列 的 平稳 性 及 可 
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表 1 RMA PNA EMD. VMD, DWT DF 
序列 的 大 气 环流 因子 优选 结果 
Tab. 1 Optimization results of atmospheric circulation 
factors for original runoff and empirical mode 
decomposition, variational mode decomposition, 


discrete wavelet transformation 


分 解 方法 时 间 序 列 KAA Git A BO) 
原始 径流 序列 G0). QC), R0). D0), K1) 
EMD IMF1 F(0),F(3),K(3),C(10),C(9) 
IMF2 K(1),J€0) J(6) .BCO) .L(6) 
IMF3 E(2) .M(6).M(7) .E(1).N(1) 
IMF4 0(0).0(1) ,PCO) .P(1) .NCO) 
IMFS P(O) .P(1) ,P(2) ,P(3) ,P(5) 
IMF6 P(0) PO) NCIO) .N(O) .NCI) 
R F(0) FC.) .FC6) .F 7) .QCO) 
VMD IMF1 A(0),A(1) \A(2) ,A(6) .ACT) 
IMF2 B(2) .B(8) .C(1) .D(7) .EC8) 
IMF3 F(O) .F(3) .F(6) .F(9) .G(0) 
IMF4 F(0) .F(4) ,F(6) .F(8) ,F(10) 
IMFS F(0) .F(3) .F(6) .F(9) ,B(5) 
IMF6 F(0) FC.) F(6) F(7) .BCS) 
IMF7 H(3),IC0) J(2) .DCO) .E(6) 
DWT A3 L(0),S(10),S(7) ,CC10) ,OC10) 
DI JOD FOO) .F(9) .Q(0) DM) 
D2 F(0),FC10) F(9) .FC7) .Q(9) 
D3 J(0) J.) ,K(6) .C(0) ECO) 


波 变换 ;IMF1~IMF7 为 固有 模 态 分量 ;R 为 趋势 项 ; A 为 逼近 信和 号 
序列 ;D1~D3 为 细节 信号 序列 ;A 为 大 西洋 副 高 北 界 ;B 为 北半球 极 
涡 强 度 指 数 ; C 为 西藏 高 原 ;D 为 太平 洋 区 涡 强 度 指数 ;E 为 亚洲 区 
极 涡 强度 指数 ;E 为 东亚 槽 强度 ; G 为 东亚 槽 位 置 ; 也 为 大 西洋 欧洲 
环流 型 C;I 为 北美 区 极 涡 强 度 指数 ;J 为 北半球 极 涡 面 积 指数 ;K 为 
北半球 极 涡 中 心 强度 ;L 为 北半球 极 涡 面积 指数 ; M 为 北半球 极 涡 
中 心 位 置 ;N 为 南方 涛 动 指 数 ; O 为 西 太平 洋 副 高 西 伸 兰 点 ;P 为 太 
HET: Q 为 北美 大 西洋 副 高 北 界 ;R 为 亚洲 区 极 涡 面积 指数 ; S 为 
欧 亚 经 向 环流 指数 。 


TE: EMD 为 经 验 模 态 分 解 ; VMD 为 变 分 模 态 分 解 ; DWT 为 离散 小 


预报 性 。 

考虑 预报 因子 对 分 解 子 序列 的 影响 ,为 了 对 照 
方便 ,构建 以 气温 、 降 水 量 以 及 前 期 径流 为 输入 项 
的 组 合 模 型 ,并 对 比分 析 增 加 大 气 环 流 因子 前 后 组 
合 径流 预测 精度 ,具体 评价 指标 见 表 3。 增 加 大 气 
环流 因子 前 后 的 径流 预测 与 原始 径流 对 比 最 终 模 
拟 结果 如 网 8 所 示 。 由 表 3 可 得 ,在 组 合 模型 的 输 
入 项 中 增加 大 气 环流 因子 对 径流 的 预测 效果 均 有 
提升 。EMD-LSTM 模型 预测 验证 期 中 NSE R e eg 
T 1.24% ,1.1296 , RMSE 降低 5.38%;VMD-LSTM 模 
型 预测 中 NSE . 尼 分 别提 高 了 2.76% ,3.6496 ,RMSE 
降低 14.06%;DWT-LSTM 模型 预测 验证 期 中 NSE R? 
分 别提 高 1.58% ,0.2296, RMSE 降低 7.21%。 从 图 8 
中 可 看 出 ,组 合 模型 的 整体 趋势 接近 原始 径流 , 具 
有 较 好 的 一 致 性 ,融和 人 大气 环流 因子 的 组 合 模型 在 
极 值 点 预测 误差 较 小 ,其 中 VMD-LSTM 模型 表现 更 
明显 。 结 果 表 明基 于 分 解 技 术 下 大 气 环流 因子 对 
子 序列 在 过 程 拟 合 与 提高 组 合 模型 精度 上 具有 和 较 
好 的 优越 性 ,尤其 在 极 值 点 预测 中 ,一 定 程度 上 改 
善 了 径流 模拟 效果 。 
3.5.3 预测 结果 对 比分 析 不 同 分 解 方法 的 各 子 序 
列 通过 LSTM 预测 合成 后 径流 精度 与 单一 模型 预测 
精度 有 差异 ,预测 结果 普遍 高 于 单一 模型 ,避免 了 
单一 模型 预测 误差 过 大 和 不 稳定 的 缺点 。 不 同 模 
型 径流 预测 值 与 实际 值 对 比如 图 9 所 示 ,丰富 预报 
因子 的 分 解 方法 下 的 组 合 模型 更 接近 实际 值 的 拟 
合 曲线 , 所 有 模型 对 比 趋势 预测 研究 极 值 表现 相对 
较 差 ,其 原因 是 人 类 活动 .气候 变化 等 因素 对 径流 
的 影响 愈 发 强烈 ,导致 不 确定 性 升 高 ,进一步 增 大 


表 2 不 同 模型 的 预测 性 能 比较 


Tab.2 Comparision of prediction performances of different models 


模型 名 称 训练 期 验证 期 

RMSE NSE R RMSE NSE R 
BP 0.514 0.833 0.845 0.637 0.808 0.865 
ELM 0.486 0.851 0.856 0.576 0.843 0.872 
LSTM 0.406 0.896 0.902 0.505 0.879 0.884 
EMD-LSTM 0.307 0.940 0.941 0.457 0.901 0.906 
VMD-LSTM 0.328 0.932 0.935 0.385 0.930 0.940 
DWT-LSTM 0.444 0.876 0.900 0.463 0.898 0.901 


注 : BP 为 误差 反 向 传播 神经 网 络 模 型 ;ELM 为 极限 学 习 机 模型 ;LSTM 为 长 短期 记忆 神经 网 络 模型 ;EMD-LSTM 为 基于 经 验 模 态 分 解 的 长 短 
期 记忆 神经 网 络 组 合 模型 ;VMD-LSTM 为 基于 变 分 模 态 分 解 的 长 短期 记忆 神经 网 络 组 合 模 型 ;DWT-LSTM 为 基于 离散 小 波 变换 的 长 短期 记 
忆 神 经 网 络 组 合 模型 ;RMSE 为 均 方 根 误差 ;NSE 为 纳什 系数 ;R 为 决定 系数 。 下 同 。 
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-— BP -e- ELM --LSTM 一 原始 径流 


时 间 / 月 


注 :BP 为 误差 反 向 传播 神经 网 络 模型 ;ELM 为 极限 学 习 机 模型 ;LSTM 为 长 短期 记忆 神经 网 络 模型 。 
7 单一 模型 月 径流 预测 结果 


Fig.7 Monthly runoff forecast results of single model 


表 3 不 同 组 合 模型 融合 大 气 环流 因子 前 后 的 径流 预测 


Tab.3 Runoff predictions before and after the atmospheric circulation factors are combined with different combination models 


"mem 训练 期 验证 期 
RMSE NSE R RMSE NSE R 
EMD-LSTM 0.353—0.307 0.9230.940 0.9250.941 0.483—0.457 0.890—0.901 0.896—0.906 
VMD-LSTM 0.337—0.328 0.9290.932 0.9230.935 0.448—0.385 0.905—0.930 0.907—0.940 
DWT-LSTM 0.484—0.444 0.8530.876 0.862—0.900 0.499—0.463 0.884—0.898 0.899—0.901 
7 


| -—EMD-LSTM -e-VMD-LSTM —-DWT-LSTM -v EMD-LSTM( 未 融合 大 气 环流 因子 ) 
-4-VMD-LSTM( 未 融合 大 气 环 流 因 子 ) <-DWT-LSTM( 未 融合 大 气 环 流 因子 ) 下 原始 径流 


时 间 / 月 


注 :EMD-LSTM 为 基于 经 验 模 态 分 解 的 长 短期 记忆 神经 网 络 组 合 模型 ;VMD-LSTM 为 基于 变 分 模 态 分 解 的 长 短期 记忆 神经 
网 络 组 合 模型 ;DWT-LSTM 为 基于 离散 小 波 变换 的 长 短期 记忆 神经 网 络 组 合 模型 。 下 同 。 
图 8 不 同 组 合 模型 融合 大 气 环流 因子 前 后 的 月 径流 预测 


Fig. 8 Prediction of monthly runoff before and after the integration of different combination models with atmospheric circulation factors 


了 预测 难度 。 测 的 研究 , 刘 艳 等 基于 EEMD-ARIMA 模型 得 到 玛 

综 上 分 析 , 组 合 模型 的 输入 项 中 增加 大 气 环流 。” 纳 斯 河 年 径流 预测 相关 系数 为 0.956。 根 据 单一 模 
因子 后 其 预测 精度 均 高 于 88%, 可 更 深入 捕获 径流 。 ”型 与 组 合 模 型 预测 结果 及 其 他 人 研究 结果 对 比 可 得 ， 
内 在 特性 。 其 他 学 者 也 做 了 有 关 玛 纳 斯 河 径流 预 。 结合 分 解 方法 来 提升 模拟 效果 的 有 效 性 , 且 增 加 大 
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图 9 不 同 模型 径流 量 预 测 值 与 实际 值 对 比 


Fig.9 Comparison between predicted and measured runoff values of different models 


气 环流 因子 可 进一步 提高 模型 预测 精度 ,为 变化 环 ”个 组 合 模型 中 ,输入 项 中 增加 大 气 环流 因子 ,使 得 


境 下 非 平稳 序列 预测 提供 可 靠 结 果 。 各 组 合 模型 的 预测 精度 均 有 提升 ,其 验证 期 径流 的 
NSE 分 别 为 0.901 .0.930 .0.898。 说 明 筛 选 预报 因子 
4 结论 对 子 序列 过 程 拟 合 优化 有 促进 作用 。 其 中 VMD- 


Lin 页 分 析 .预报 因子 筛选 和 深度 学 3 LSTM 模型 在 径流 总 体 趋 势 和 极 值 预测 中 均 有 良好 
本 文 运用 时 频 分 析 预报 因子 第 选 和 深度 学 习 。 效果 具 志 较 强 的 泛 化 能 力 其 可 为 优化 水 六 预报 


模型 组 合 的 预测 方法 ,建立 月 径流 预测 模型 ,以 表 secco ioco PRI EU SÉ. 


M 


epee aie ,对 不 同 模型 效果 进行 在 深度 学 习 神 经 网 络 模型 中 加 入 具有 物理 意 
分 析 比 较 ,得 出 以 下 结论 义 的 大 气 环流 因子 可 以 有 效 提高 模型 精度 ,在 后 续 


(I) 采用 EMD、VMD、DWT 3 种 分 解 方法 均 可 。 的 研究 中 可 对 数据 进行 更 深层 次 的 控 掘 ,实现 数据 
提取 原始 序列 中 具有 不 同 频 率 的 固有 信息 ,削弱 了 的 有 效 辨别 ;进一步 运用 优化 算法 调整 模型 参数 ， 
原始 径流 序列 的 非 平稳 性 ,降低 了 预测 难度 。 提高 径流 预测 精度 ,获得 更 理想 的 预测 结 

(2) 充分 利用 不 同 频率 的 子 序列 ,构建 的 基于 
时 频 分 析 的 LSTM 组 合 模 型 ,其 径流 时 间 序 列 被 分 。 参考 文献 (References) 
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Runoff prediction with LSTM-based combination model 


on time-frequency analysis 
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Abstract: This study investigated the complex nonlinear and nonstationary characteristics of runoff time series in 
a changing environment. We obtained accurate and reliable runoff prediction results by constructing long-short 
term memory (LSTM) combination models on the basis of time frequency analysis methods. The combination 
models were then applied to the Manas River, Xinjiang, China, a typical inland river in an arid area. Empirical 
mode decomposition (EMD), variational mode decomposition (VMD), and discrete wavelet transform (DWT) 
were first applied to decompose the original runoff series into several subsequences with different frequencies 
and characteristics. Second, we used the previous runoff, precipitation, temperature, and atmospheric circulation 
factors as the input variables of the LSTM model. At the same time, the optimal predictor of each subsequence 
was determined according to random forest classification and the Pearson correlation coefficient. Finally, the 
combined models were based on a combination of VMD, EMD, and DWT with LSTM. Accordingly, they were 
called VMD-LSTM, EMD-LSTM, and DWT-LSTM and are proposed and applied for runoff forecasting. The total 
output of all submodules was treated as the final forecasting result for the original runoff. A single back 
propagation neural network, a single extreme learning machine, and a single LSTM were adopted as comparative 
forecast models. The results indicated that the VMD-LSTM model had the best forecasting performance among 
all the models in terms of its Nash-Sutcliffe error (NSE=0.930), root mean square error (RMSE=0.385), and 
coefficient of determination (R’*=0.940). The extreme value prediction error for the runoff of the VMD-LSTM 
model was within 15%, and it had a good effect on the overall trend prediction and extreme value tracking 
regarding the runoff. This result further verified the accuracy and stability of the VMD-LSTM model. On the 
basis of the above results, the accuracy and stability of the VMD-LSTM model were further verified. Thus, on the 
basis of sequence decomposition, considering the influence of predictors on subsequences can help promote 
accurate and stable prediction results. These research results will provide a reference for river basin water 
resource planning and dispatching. 


Key words: runoff prediction; combination model; time-frequency analysis; long short-term memory 


